本章小结
参数估计问题分为点估计和区间估计。点估计是适当地选择一个统计量作为未知参数的估计(称为估计量),若已取得一样本,将样本值代入估计量,得到估计量的值,以估计量的值作为未知参数的近似值(称为估计值)。
本章介绍了两种求点估计的方法:矩估计法和最大似然估计法。
矩估计法的做法是,以样本矩作为总体矩的估计量,而以样本矩的连续函数作为相应的总体矩的连续函数的估计量,从而得到总体未知参数的估计。
最大似然估计法的基本想法是,若已观察到样本的样本值
,而取到这一样本值的概率为
(在离散型的情况),或
落在这一样本值
的邻域内的概率为
(在连续的情况),而
与未知参数有关,我们就取
的估计值使概率
取到最大。在统计问题中往往先使用最大似然估计法,在最大似然估计法使用起来不方便时,再用矩估计法。
对于一个未知参数可以提出不同的估计量,因此自然提出比较估计量的好坏的问题,这就需要给出评定估计量好坏的标准。估计量是一个随机变量,对于不同的样本值,一般给出参数的不同估计值。因而在考虑估计量的好坏时,应从某种整体性能去衡量,而不能看它在个别样本之下表现如何。本章介绍了三个标准:无偏性、有效性和相合性。相合性是对估计量的一个基本要求,不具备相合性的估计量,我们是不予考虑的。
点估计不能反映估计的精度,我们引入了区间估计。置信区间是一个随机区间,它覆盖未知参数具有预先给定的高概率(置信水平),即对于任意
,有
。
例如,对于正记分布未知,可得
的一个置信水平为
的置信区间为
, (7.4)
就是说这一随机区间覆盖的概率
。一旦有了一个样本的
,将它代入(7.4),得到一个数量区间
,
也称为
的置信水平为
的置信区间,意指“
包含
”这一陈述的可信程度为
。如果将这事实写成
是错误的,因为
是一个数量区间,要么有
,此时
;要么有
,此时
。
本章还介绍了单侧置信区间,例如,对于正态分布,
未知,可得
的置信水平为
的单侧置信区间为
(i),单侧置信上限为
。
(ii),单侧置信下限为
。也即只需将置信区间(7.4)的上下限中的“
”改成“
”,就得到相应的单侧置信上下限了。